Top-$ k $分类是对信息检索,图像分类和其他极端分类设置中广泛使用的多类分类的概括。已经提出了几种类似铰链的(分段线性)替代物,但所有这些都不是不一致的或不一致的。对于提出的凸状替代物(即多面体),我们应用了Finocchiaro等人的最新嵌入框架。 (2019; 2022)确定替代物是一致的预测问题。这些问题都可以解释为顶部 - $ K $分类的变体,这可能与某些应用程序更好。我们利用此分析来得出对条件标签分布的限制,在该分布中,这些拟议的替代物在顶级$ k $中变得一致。有人进一步建议,对于顶部$ k $,每个凸铰链样的替代物都必须不一致。但是,我们使用相同的嵌入框架为此问题提供第一个一致的多面体代理。
translated by 谷歌翻译
我们正式化并研究通过嵌入设计凸替代损失函数的自然方法,例如分类,排名或结构化预测等问题。在这种方法中,一个人将每一个有限的预测(例如排名)嵌入$ r^d $中的一个点,将原始损失值分配给这些要点,并以某种方式“凸出”损失以获得替代物。我们在这种方法和多面体(分段线性凸)的替代损失之间建立了牢固的联系:每个离散损失都被一些多面体损失嵌入,并且每个多面体损失都嵌入了一些离散的损失。此外,嵌入会产生一致的链接功能以及线性替代遗憾界限。正如我们用几个示例所说明的那样,我们的结果具有建设性。特别是,我们的框架为文献中各种多面体替代物以及不一致的替代物提供了简洁的证据或不一致的证据,它进一步揭示了这些代理人一致的离散损失。我们继续展示嵌入的其他结构,例如嵌入和匹配贝叶斯风险的等效性以及各种非算术概念的等效性。使用这些结果,我们确定与多面体替代物一起工作时,间接启发是一致性的必要条件也足够了。
translated by 谷歌翻译
我们正规化并研究通过嵌入式设计凸代理损失功能的自然方法,诸如分类,排名或结构化预测等问题。在这种方法中,一个将每个主要的预测(例如\排名)嵌入$ \ mathbb {r} ^ d $中的一个点,将原始损耗值分配给这些点,并以某种方式“凸出”损失获得代理人。我们在这种方法和多面体(分段 - 线性凸)代理损失之间建立了强大的联系。鉴于任何多面体损失$ L $,我们提供了一个联系功能的建设,其中$ l $是它嵌入的损失的一致代理人。相反,我们展示了如何为任何给定的离散损失构建一致的多面体代理。我们的框架在文献中产生了各种多面体代理人的一致性或不一致的简洁证明,并且对于不一致的代理人,它进一步揭示了这些替代品的离散损失是一致的。我们展示了一些额外的嵌入结构,例如嵌入和匹配贝叶斯风险的等价,以及各种概念的非赎罪概念的等价。使用这些结果,我们建立了间接诱导,在使用多面体替代品时也足够了。
translated by 谷歌翻译
成本敏感的分类对于错误分类错误的成本差异很大,至关重要。但是,过度参数化对深神经网络(DNNS)的成本敏感建模构成了基本挑战。 DNN完全插值训练数据集的能力可以渲染DNN,纯粹在训练集上进行评估,无效地区分了成本敏感的解决方案和其总体准确性最大化。这需要重新思考DNN中的成本敏感分类。为了应对这一挑战,本文提出了一个具有成本敏感的对抗数据增强(CSADA)框架,以使过度参数化的模型成本敏感。总体想法是生成针对性的对抗示例,以推动成本感知方向的决策边界。这些有针对性的对抗样本是通过最大化关键分类错误的可能性而产生的,并用于训练一个模型,以更加保守的对成对的决策。公开可用的有关著名数据集和药物药物图像(PMI)数据集的实验表明,我们的方法可以有效地最大程度地减少整体成本并减少关键错误,同时在整体准确性方面达到可比的性能。
translated by 谷歌翻译
为了安全地在现实世界中部署腿部机器人,有必要为他们提供可靠地检测出意外接触并准确估算相应接触力的能力。在本文中,我们提出了针对四足动物的碰撞检测和识别管道。我们首先引入了一种基于带通滤波的碰撞时间跨度的方法,并证明此信息是获得准确的碰撞力估计值的关键。然后,我们通过补偿模型不准确性,未建模的载荷以及作用在机器人上的任何其他潜在的准静态干扰来源来提高所识别力量幅度的准确性。在各种情况下,我们通过广泛的硬件实验来验证我们的框架,包括小跑和机器人上的其他未建模负载。
translated by 谷歌翻译
结肠镜检查的柔性内窥镜由于其固有的复杂性而产生了一些局限性,导致患者不适和缺乏临床医生的直觉。机器人设备和自主控制代表了一种可行的解决方案,以减少内镜医生的工作量和训练时间,同时改善整体程序结果。自主内窥镜控制的先前工作使用启发式政策,将其概括限制在非结构化和高度可变形的结肠环境中,需要频繁进行人类干预。这项工作提出了一种基于图像的内窥镜控制,使用深钢筋学习,称为深度视觉运动控制(DVC),以在结肠道的复杂部分中表现出适应性行为。 DVC学习内窥镜图像与内窥镜的控制信号之间的映射。对20位专家胃肠道内镜医生进行的首次用户研究是为了将其导航性能与使用现实的虚拟模拟器进行比较的DVC策略。结果表明,DVC在几个评估参数上显示出同等的性能,更安全。此外,与最先进的启发式控制政策相比,对20名新手参与者进行了第二次用户研究,以证明人类的监督更容易。对结肠镜检查程序的无缝监督将使干预主义者能够专注于医疗决策,而不是内窥镜的控制问题。
translated by 谷歌翻译
本文开发了一个名为“提供者 - 核能机构”(PCR)的新型框架,适用于社会辅助机器人,该机器人支持对人类机器人相互作用中共同理解的研究。提供者,客户和机器人共享对环境的可行和直观的表示,以创建最能满足各方综合需求的计划。该计划是通过基于先前构建的多模式导航图的客户端和机器人之间的交互形成的。在与客户互动之前,在提供商和机器人之间进行了协作,以导航图的形式进行解释的环境表示形式。我们建立了提出的框架的实现,以自主创建室内环境的空间语义表示。此外,我们开发了一个计划者,该计划者受到该机构的提供者和客户的约束,并动态地计划了对每个感兴趣领域的访问。评估表明,PCR框架的拟议实现可以成功制定计划,同时满足指定的时间预算和序列约束,并超越贪婪的基线。
translated by 谷歌翻译
Federated学习(FL)最近已成为流行的隐私合作学习范式。但是,它遭受了客户之间非独立和相同分布的(非IID)数据的困扰。在本文中,我们提出了一个新颖的框架,称为合成数据辅助联合学习(SDA-FL),以通过共享合成数据来解决这一非IID挑战。具体而言,每个客户端都预测了本地生成对抗网络(GAN)以生成差异化私有合成数据,这些数据被上传到参数服务器(PS)以构建全局共享的合成数据集。为了为合成数据集生成自信的伪标签,我们还提出了PS执行的迭代伪标记机制。本地私人数据集和合成数据集与自信的伪标签的结合可导致客户之间的数据分布几乎相同,从而提高了本地模型之间的一致性并使全球聚合受益。广泛的实验证明,在监督和半监督的设置下,所提出的框架在几个基准数据集中的大幅度优于基线方法。
translated by 谷歌翻译
在分散的学习中,节点网络协作以最小化通常是其本地目标的有限总和的整体目标函数,并结合了非平滑的正则化术语,以获得更好的泛化能力。分散的随机近端梯度(DSPG)方法通常用于培训这种类型的学习模型,而随机梯度的方差延迟了收敛速率。在本文中,我们提出了一种新颖的算法,即DPSVRG,通过利用方差减少技术来加速分散的训练。基本思想是在每个节点中引入估计器,该节点周期性地跟踪本地完整梯度,以校正每次迭代的随机梯度。通过将分散的算法转换为具有差异减少的集中内隙近端梯度算法,并控制错误序列的界限,我们证明了DPSVRG以o(1 / t)$的速率收敛于一般凸起目标加上非平滑术语以$ t $作为迭代的数量,而dspg以$ o(\ frac {1} {\ sqrt {t}})$汇聚。我们对不同应用,网络拓扑和学习模型的实验表明,DPSVRG会收敛于DSPG的速度要快得多,DPSVRG的损耗功能与训练时期顺利降低。
translated by 谷歌翻译
联邦边缘学习(诱导)吸引了许多隐私范例的关注,以有效地纳入网络边缘的分布式数据来训练深度学习模型。然而,单个边缘服务器的有限覆盖范围导致参与者的客户节点数量不足,这可能会损害学习性能。在本文中,我们调查了一种新颖的感觉框架,即半分散的联邦边缘学习(SD-INES),其中采用多个边缘服务器集体协调大量客户端节点。通过利用边缘服务器之间的低延迟通信进行高效的模型共享,SD-Feels可以包含更多的培训数据,同时与传统联合学习相比享受更低的延迟。我们详细介绍了三个主要步骤的SD感觉的培训算法,包括本地模型更新,群集内部和群集间模型聚合。在非独立和相同分布的(非IID)数据上证明了该算法的收敛性,这也有助于揭示关键参数对培训效率的影响,并提供实用的设计指南。同时,边缘装置的异质性可能导致级体效应并降低SD感应的收敛速度。为了解决这个问题,我们提出了一种具有SD-Iave的稳定性舒长方案的异步训练算法,其中,还分析了收敛性能。模拟结果展示了所提出的SD感觉和证实我们分析的算法的有效性和效率。
translated by 谷歌翻译